Analyse d'une variable quantitative censurée à gauche : exemple du taux de procalcitonine - 02/03/08
J. Asselineau [1 et 2],
R. Thiébaut [1, 2 et 3],
P. Perez [1 et 2],
G. Pinganaud [4],
G. Chêne [1, 2 et 5]
Voir les affiliationspages | 8 |
Iconographies | 8 |
Vidéos | 0 |
Autres | 0 |
Résumé |
Position du problème |
Lorsque la sensibilité d'une technique de dosage utilisée pour quantifier un marqueur est faible, certaines valeurs sont censurées à gauche. L'analyse de telles données nécessite la mise en œuvre de techniques statistiques appropriées. L'objectif de ce travail est de comparer différentes méthodes de prise en compte de cette censure dans une analyse de régression en les appliquant à des données réelles.
Méthodes |
Les données sont issues d'une étude évaluant les performances de la procalcitonine dans le diagnostic d'infection bactérienne chez les personnes âgées. Onze des 85 patients inclus présentaient une concentration sanguine de procalcitonine inférieure au seuil de détectabilité. Une étude de simulation a été réalisée à l'aide de données de concentration échantillonnées selon une loi normale de paramètres estimés sur les données réelles. Différents niveaux de censure ont été simulés (13, 25 et 50 %). L'association entre les concentrations sanguines de procalcitonine et de protéine C réactive a été étudiée par un modèle de régression linéaire. Les différentes méthodes de gestion de la censure à gauche étaient : la méthode des cas complets, les méthodes d'imputation simple et d'imputation multiple et la modélisation paramétrique. Dans l'étude de simulation, les estimations ont été comparées entre elles en termes de biais et d'erreur quadratique moyenne pour chaque niveau de censure. Les estimations issues de l'application ont également été comparées entre les différentes méthodes. Toutes les analyses ont été implémentées avec le logiciel SAS®.
Résultats |
Dans l'étude de simulation, la modélisation paramétrique utilisant le maximum de vraisemblance présentait les meilleures performances pour les trois niveaux de censure. À l'inverse, les méthodes des cas complets et d'imputation simple étaient très biaisées. Dans l'application, les estimations de la pente de régression étaient très proches entre les méthodes. Néanmoins, les degrés de signification du test associés à ce paramètre variaient de 0,0001 à 0,13 menant à des décisions différentes.
Conclusion |
L'analyse d'une variable dépendante censurée à gauche requiert une attention toute particulière puisque différentes méthodes peuvent produire des résultats menant à des conclusions différentes.
Abstract |
Background |
When the sensitivity of an assay used to quantify a marker is poor, some of the values are below the detection limit resulting in left-censoring. Analysis of such data requires appropriate statistical techniques. In this study, we aimed at comparing various methods used to deal with left-censored outcome in regression analysis.
Methods |
The application was a real study evaluating the performance of procalcitonin for the diagnosis of bacterial infections among elderly patients. Among 85 patients, eleven had a procalcitonin value below the detection limit. A simulation study was then performed with data sampled according to a Gaussian distribution with parameters estimated on observed data. Various levels of left-censoring were simulated (13, 25 and 50%). A linear regression model was used to explain procalcitonin variations according to another marker, C reactive protein. To handle left-censoring, several methods were used: complete case analysis, simple imputation and multiple imputation methods, and parametric modelling. In the simulation study, estimations according to different methods were compared in terms of bias and mean square error according to each left-censoring level. Estimations obtained with real data were also compared according to the methods used. All analyses were implemented using SAS® software.
Results |
In the simulation study, parametric modelling using maximum likelihood showed best performances whatever the level of censoring. On the other hand, methods using complete cases and simple imputation by the detection limit were highly skewed. On observed data, estimations of the slope varied slightly according to the methods. However the p-values (Wald test) of β = 0 varied from 0.0001 to 0.13 leading to different decisions according to the method used.
Conclusion |
Left-censoring handling in data analysis requires special attention, as different methods may yield results leading to different conclusions.
Mots clés :
Censure à gauche
,
Limite de quantification
,
Maximum de vraisemblance
,
Imputation multiple
,
Analyse de sensibilité
Keywords: Left-censored data , Quantification limit , Maximum likelihood , Multiple imputation , Sensitivity analysis
Plan
© 2006 Elsevier Masson SAS. Tous droits réservés.
Vol 55 - N° 3
P. 213-220 - juin 2007 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’achat d’article à l’unité est indisponible à l’heure actuelle.
Déjà abonné à cette revue ?